智能论文笔记

The Past as a Stochastic Process

David H. Wolpert , Michael H. Price , Stefani A. Crabtree , Timothy A. Kohler , Jurgen Jost , James Evans , Peter F. Stadler , Hajime Shimao , Manfred D. Laubichler

分类：机器学习

2021-12-11

历史流程表现出显着的多样性。尽管如此，学者们长期以来一直试图识别模式，并将历史行动者分类和对一些成功的影响。随机过程框架提供了一种结构化方法，用于分析大型历史数据集，允许检测有时令人惊讶的模式，鉴定内源性和外源对过程的相关因果作用者，以及不同历史案例的比较。随机过程的数据，分析工具和组织理论框架的组合使历史和考古中的传统叙事方法补充了传统的叙事方法。

translated by 谷歌翻译

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

Comparison of Lexical Alignment with a Teachable Robot in Human-Robot and Human-Human-Robot Interactions

Yuya Asano , Diane Litman , Mingzhi Yu , Nikki Lobczowski , Timothy Nokes-Malach , Adriana Kovashka , Erin Walker

分类：自然语言处理 | 机器人

2022-09-23

扬声器在彼此保持一致的过程中建立了融洽的关系。在指导域材料的同时，已经证明了与教师的融洽关系，以促进学习。过去关于教育领域的词汇一致性的工作都在量化对齐方式的措施和与代理对齐的相互作用的类型中都遭受了限制。在本文中，我们采用基于数据驱动的共享表达式概念（可能由多个单词组成）的对齐措施，并比较一对一的人类机器人（H-R）相互作用的对齐方式与协作人类人类的H-R部分中的对齐方式-Orobot（H-H-R）相互作用。我们发现，H-R设置中的学生与H-H-R设置相比，与可教的机器人保持一致，并且词汇一致性和融洽关系之间的关系比以前的理论和经验工作所预测的要复杂。

translated by 谷歌翻译

A Machine Learning Approach to Solving Large Bilevel and Stochastic Programs: Application to Cycling Network Design

Timothy C. Y. Chan , Bo Lin , Shoshanna Saxe

分类：机器学习

2022-09-20

我们提出了一种基于机器学习的新型方法来解决涉及大量独立关注者的二重性程序，作为一种特殊情况，其中包括两阶段随机编程。我们提出了一个优化模型，该模型明确考虑了追随者的采样子集，并利用机器学习模型来估计未采样关注者的客观值。与现有方法不同，我们将机器学习模型培训嵌入到优化问题中，这使我们能够采用无法使用领导者决策来表示的一般追随者功能。我们证明了由原始目标函数衡量的生成领导者决策的最佳差距，该目标函数考虑了整个追随者集。然后，我们开发追随者采样算法来收紧界限和一种表示追随者功能的表示方法，可以用作嵌入式机器学习模型的输入。使用骑自行车网络设计问题的合成实例，我们比较方法的计算性能与基线方法。我们的方法为追随者的目标价值观提供了更准确的预测，更重要的是，产生了更高质量的领导者决策。最后，我们对骑自行车基础设施计划进行了现实世界中的案例研究，我们采用方法来解决超过一百万关注者的网络设计问题。与当前的自行车网络扩展实践相比，我们的方法提出了有利的性能。

translated by 谷歌翻译

Bayesian Algorithm Execution for Tuning Particle Accelerator Emittance with Partial Measurements

Sara A. Miskovich , Willie Neiswanger , William Colocho , Claudio Emma , Jacqueline Garrahan , Timothy Maxwell , Christopher Mayes , Stefano Ermon , Auralee Edelen , Daniel Ratner

分类：人工智能 | 机器学习

2022-09-10

在处理多点测量时，即传统的黑盒优化方法效率低下，即，当控制域中的每个查询需要在次级域中的一组测量以计算目标时。在粒子加速器中，四极扫描的发射率调整是具有多点测量的优化示例。尽管发射率是高亮度机器（包括X射线激光器和线性碰撞者）的性能的关键参数，但综合优化通常受到调整所需的时间的限制。在这里，我们将最近提供的贝叶斯算法执行（BAX）扩展到具有多点测量的优化任务。 BAX通过在关节控制测量域中选择和建模各个点来实现样品效率。我们将BAX应用于Linac相干光源（LCLS）和晚期加速器实验测试II（Facet-II）粒子加速器的设施。在LCLS模拟环境中，我们表明BAX的效率提高了20倍，同时与传统优化方法相比，噪声也更强。此外，我们在LCLS和facet-II上运行了Bax，与Facet-II的手工调整发射率相匹配，并获得了比LCLS在LCLS上获得的最佳发射率低24％。我们预计我们的方法很容易适应其他类型的优化问题，这些优化问题涉及科学仪器中常见的多点测量。

translated by 谷歌翻译

A Principled Evaluation Protocol for Comparative Investigation of the Effectiveness of DNN Classification Models on Similar-but-non-identical Datasets

Esla Timothy Anzaku , Haohan Wang , Arnout Van Messem , Wesley De Neve

分类：机器学习 | 计算机视觉

2022-09-05

深度神经网络（DNN）模型越来越多地使用新的复制测试数据集进行评估，这些数据集经过精心创建，类似于较旧的和流行的基准数据集。但是，与期望相反，DNN分类模型在这些复制测试数据集上的准确性上表现出显着，一致且在很大程度上无法解释的降解。虽然流行的评估方法是通过利用各自测试数据集中可用的所有数据点来评估模型的准确性，但我们认为这样做会阻碍我们充分捕获DNN模型的行为以及对其准确性的现实期望。因此，我们提出了一种原则性评估协议，该协议适用于在多个测试数据集上对DNN模型的准确性进行比较研究，利用可以使用不同标准（包括与不确定性相关信息）选择的数据点子集进行的子集。通过使用此新评估协议，我们确定了（1）CIFAR-10和Imagenet数据集上$ 564 $ DNN型号的准确性，以及（2）其复制数据集。我们的实验结果表明，已观察到的基准数据集及其复制之间观察到的准确性降解始终较低（即模型在复制测试数据集上的性能更好），而不是在已发表的作品中报告的准确性退化，并依靠这些已发表的作品依赖于常规评估。不利用不确定性相关信息的方法。

translated by 谷歌翻译

Development and Validation of ML-DQA -- a Machine Learning Data Quality Assurance Framework for Healthcare

Mark Sendak , Gaurav Sirdeshmukh , Timothy Ochoa , Hayley Premo , Linda Tang , Kira Niederhoffer , Sarah Reed , Kaivalya Deshpande , Emily Sterrett , Melissa Bauer

分类： (统计)机器学习 | 机器学习

2022-08-04

机器学习和临床研究社区利用现实世界数据（RWD）的方法，包括电子健康记录中捕获的数据（EHR）截然不同。虽然临床研究人员谨慎使用RWD进行临床研究，但用于医疗团队的ML会消费公共数据集，并以最少的审查来开发新算法。这项研究通过开发和验证ML-DQA来弥合这一差距，ML-DQA是基于RWD最佳实践的数据质量保证框架。 ML-DQA框架适用于两个地理位置的五个ML项目，分别是不同的医疗状况和不同的人群。在这五个项目中，共收集了247,536名患者的RWD，共有2,999项质量检查和24份质量报告。出现了五种可推广的实践：所有项目都使用类似的方法来分组冗余数据元素表示；所有项目都使用自动实用程序来构建诊断和药物数据元素；所有项目都使用了一个共同的基于规则的转换库；所有项目都使用统一的方法将数据质量检查分配给数据元素；所有项目都使用类似的临床裁决方法。包括临床医生，数据科学家和受训者在内的平均有5.8个人参与每个项目实施ML-DQA，每个项目平均进行了23.4个数据元素。这项研究证明了ML-DQA在医疗项目中的重要性作用，并为团队提供了开展这些基本活动的框架。

translated by 谷歌翻译

Multiface: A Dataset for Neural Face Rendering

Cheng-hsin Wuu , Ningyuan Zheng , Scott Ardisson , Rohan Bali , Danielle Belko , Eric Brockmeyer , Lucas Evans , Timothy Godisart , Hyowon Ha , Alexander Hypes

分类：计算机视觉

2022-07-22

近年来，人类面孔的影子化化身已经走了很长一段路，但是该地区的研究受到缺乏公开可用的高质量数据集的限制。在这项工作中，我们介绍了Multiface，这是一种新的多视图，高分辨率的人脸数据集，该数据集是从13个身份的神经面部渲染研究中收集的13个身份。我们介绍了Mugsy，这是一种大型多摄像机设备，可捕获面部表现的高分辨率同步视频。 Multiface的目的是缩小学术界高质量数据的可访问性的差距，并使VR触觉研究能够进行研究。随着数据集的释放，我们对不同模型体系结构对模型的新观点和表达式的插值能力进行消融研究。通过有条件的VAE模型作为我们的基线，我们发现添加空间偏见，纹理翘曲场和残差连接可改善新型视图合成的性能。我们的代码和数据可在以下网址获得：https：//github.com/facebookresearch/multiface

translated by 谷歌翻译

Applying data technologies to combat AMR: current status, challenges, and opportunities on the way forward

Leonid Chindelevitch , Elita Jauneikaite , Nicole E. Wheeler , Kasim Allel , Bede Yaw Ansiri-Asafoakaa , Wireko A. Awuah , Denis C. Bauer , Stephan Beisken , Kara Fan , Gary Grant

分类：人工智能 | 机器学习

2022-07-05

抗微生物抗性（AMR）是日益增长的公共卫生威胁，估计每年造成超过1000万人死亡，在现状预测下，到2050年，全球经济损失了100万亿美元。这些损失主要是由于治疗失败的发病率和死亡率增加，医疗程序中的AMR感染以及归因于AMR的生活质量损失所致。已经提出了许多干预措施来控制AMR的发展并减轻其传播带来的风险。本文回顾了细菌AMR管理和控制的关键方面，这些方面可以利用人工智能，机器学习以及数学和统计建模等数据技术，这些领域在本世纪已经快速发展。尽管数据技术已成为生物医学研究的组成部分，但它们对AMR管理的影响仍然很小。我们概述了使用数据技术来打击AMR，详细介绍了四个互补类别的最新进展：监视，预防，诊断和治疗。我们在生物医学研究，临床实践和“一个健康”背景下使用数据技术提供了有关当前AMR控制方法的概述。我们讨论了数据技术的潜在影响和挑战在高收入和中等收入国家中面临的实施，并建议将这些技术更容易地整合到医疗保健和公共卫生中所需的具体行动，并建议使用具体的行动部门。

translated by 谷歌翻译

Visual Foresight With a Local Dynamics Model

Colin Kohler , Robert Platt

分类：机器人 | 人工智能 | 机器学习

2022-06-29

已证明无模型的策略学习能够学习操纵政策，可以使用单步操作原始人来解决长期的视野任务。但是，培训这些政策是一个耗时的过程，需要大量数据。我们提出了局部动力学模型（LDM），该模型有效地学习了这些操纵原始基底的状态转换函数。通过将LDM与无模型的政策学习相结合，我们可以学习可以使用一步lookahead计划来解决复杂的操纵任务的政策。我们表明，LDM既是样本效率更高又胜过其他模型体系结构。与计划结合使用时，我们可以在模拟中的几项具有挑战性的操纵任务上胜过其他基于模型和模型的政策。

translated by 谷歌翻译